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Beschreibung 

Verfahren zur Erkennung und Schatzung der raumlichen Lage von Objekten aus einer zweidimensionalen Abbildung 

5 Bei den meisten Anwendungen der maschinellen Bildverarbeitung und des Bildverstehens in Anwendungsgebie- 

ten wie Robotik und Fertigungsautomatisierung, sind Verfahren zur maschinellen Erkennung dreidimensionaler Ob- 
jekte und ihrer Lage im Raum von grundlegender Bedeutung. In vielen dieser Anwendungsfalle stehen Tiefendaten 
nicht zur Verfugung und sind auch nicht mit Hilfe von Stereobildem Oder zeitlichen Bildfolgen, in denen die Objektbe- 
wegung oder die Kamerabewegung zur Gewinnung von Tiefendaten ausgewertet werden konnte, zu ermitteln. In sol- 

10 chen Fallen muG anhand einer einzelnen zweidimensionalen Abbildung des zu erkennenden Objektes die Objektiden- 
titat und seine Lage im Raum aus der zweidimensionalen Abbildung rekonstruiert werden. Hierzu mussen im allge- 
meinen Modelle fur die zu erkennenden Objekte und ein Modell fOr den AbbildungsprozeB verwendet werden. Aus 
Vereinfachungsgrunden werden Objekte vielfach mit Hilfe ihrer Eckpunkte und Kantenlinien modelliert. Die optische 
Abbildung des Raumes in die Bildebene kann in vielen Fallen mit hinreichender Genauigkeit z.B. durch die Zentral- 

15 projektion angenahert werden. Das technische Problem bei der Erkennung und Schatzung der Lageparameter drei- 
dimensionaler Objekte im Raum aus einer zweidimensionalen Abbildung, oftmals auch als n-Punkte-Perspektivpro- 
blem bezeichnet, besteht in der Bestimmung der Lage und raumlichen Anordnung eines dreidimensionalen Objekts 
aus n Merkmalspunkten, die mit Hilfe geeigneter Vorverarbeitungsverfahren in einer zweidimensionalen Abbildung 
des zu erkennenden Objekts gefunden wurden. Beispiele fur solche Merkmalspunkte sind u.a. Abbilder von Objek- 

20 teckpunkten oder Abbilder von anderen markanten Punkten auf der Objektoberflache. 

Aus der Literatur sind verschiedene Verfahren zur Lageschatzung dreidimensionaler Objekte im Raum bekannt. 
Im wesentiichen lassen sich zwei Typen von Verfahren unterscheiden: Zum einen gibt es Ansatze zur analytischen 
Losung des n-Punkte-Perspektivproblems, die sich mit der minimalen Anzahl von Korrespondenzen beschaftigen, 
welche man benotigt, urn das Perspektivproblem starrer Objekte, d.h. das Problem der Zuordnung zwischen Objek- 
ts teckpunkten und Merkmalspunkten in der Bildebene, zu losen. Bei diesen Verfahrenstypen wird der die Abbildung 
modellierende Zusammenhang zwischen Punkten im Raum und Punkten in der Bildebene, z. B die Zentralprojektion, 
zur Aufstellung eines Gleichungssystems verwendet. Je nach der Zahl der Merkmalspunkte in der Bildebene kann 
dieses Gieichungssystem unterbestimmt, eindeutig losbar, oder uberbestimmt sein. Diese Verfahren verwenden des- 
halb im allgemeinen eine Teilmenge alter verfugbaren Merkmalspunkte in der Bildebene, welche auf ein eindeutig 

30 losbares und gut konditioniertes Gieichungssystem fOhren. Ein derartiges Verfahren wird z.B. in der Veroffentlichung 
von R.M. Haralick, "Using Perspective Transformations in Scene Analysis 1 , Computer Vision, Graphics and Image 
Processing 13, 1980, pp. 191-221, beschrieben. Verfahren dieses Typs fuhren im allgemeinen zu uber- oder unterbe- 
stimmten Gleichungssystemen, erfordern deshalb eine Vorverarbeitung der Abbildung mit dem Ziel der Auswahl einer 
geeigneten Menge von Merkmalspunkten, und sind im allgemeinen wenig robust gegen Storungen. 

35 Ein zweiter Verfahrenstyp bedient sich der iterativen Losung uberbestimmter Gleichungssysteme mit Hilfe von 

nichtlinearen Minimierungsverfahren. Dabei wird eine Kostenf unktion, welche durch zuvor gefundene Korresponden- 
zen zwischen Bildmerkmalen und Modeltparametern bestimmt wird, minimiert. Ein Beispiel fur diesen zweiten Verfah- 
renstyp ist in der Veroffentlichung von D.G. Lowe "Three-Dimensional Object Recognition from Single Two-Dimensional 
Images", Artificial Intelligence 31 , 1987, pp. 355-395, beschrieben. Dieser zweite Verfahrenstyp ist zwar weitaus we- 

40 niger empfindlich gegen Storungen, hat aber wie der erste Verfahrenstyp den Nachteil, daft ein nichtiineares analyti- 
sches Modell des optischen Abbildungsvorganges benotigt wird und mit numerischen Methoden verarbeitet werden 
muQ. 

Wei-Chung Lin et al., "A Connectionist Approach to Multiple-View Based 3-D Object Recognition" (International 
Joint Conference on Neural Networks, IJCNN 1990), benutzen Hopfield-Neuronale Netze (mit gewohnlicher, zweidi- 

45 mensionaler Geometrie), urn Identitat und Lage von 3-D Objekten festzustellen; als Eingabemerkmale werden zunachst 
Flache und relative Entfernungen der einzelnen Polygone benutzt, die das Objekt in seiner 2-D Projektion beschreiben. 
Nach der derartigen "groben" Analyse der Oberflachenubereinstimmungen werden die Eckpunkte der Polygone des 
unbekannten Objektes in ein zweites neuronales Netz eingegeben, das dann die Korrespondenzen zwischen diesen 
Eckpunkten etabliert und somit eine grdQte Ahnlichkeit mit einem Modellmuster feststellt. 

so Aus M.M. Yen und M.R. Blackburn, "Feature Maps Based Weight Vectors for Spatiotemporal Pattern Recognition 

With Neural Nets" (IJCNN 1 990) ist ein Adaptationsverfahren fur ein Kohonen-Neuronales Netz bekannt, das die Lern- 
rate und die Kopplungsstar kef unktion mit der Zeit monoton fallen laftt. 
Der Erfindung ist in den unabhangigen Anspruchen definiert. 

Das erfindungsgemaBe Verfahren basiert auf der Methode der adaptiven Vektorquantisierung, welche mit Hilfe 
55 von Beg riff en aus dem Bereich der neuronalen Netzwerke auch als sog. 

Kohonen-Netz formuliert werden kann (T. Kohonen, "Representation of Sensory Information in Self Organizing 
Feature Maps, and Relation of these Maps to Distributed Memory Networks", Proc. SPIE Optical and Hybrid computing, 
vol. 634, pp. 248-259, 1 986). Dabei werden aus den zweidimensionalen Kpordinaten von Merkmalspunkten in der 
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Abbildungsebene sog. Mustervektoren gebildet, welche mit abgespeicherten Referenzmustern, die in der Sprache der 
Kohonen-Netze auch als Gewichtskoeffizienten bezeichnet werden, verglichen werden. Jedem Referenzmuster ist 
dabei eine Interpretation zugeordnet, welche direkt auf die Lageparameter des zu erkennenden Objekts sowie auf die 
Objektidentitat schlieBen laBt. Die gesuchten Lageparameter bzw. die gesuchte Objektkennung ergibt sich dabei als 

s Interpretation desjenigen Referenzmusters, das dem die Merkmalspunkte der Abbildungsebene reprasentierenden 
Mustervektor am ahnlichsten ist. 

Die Genauigkeit und Zuverlassigkeit dieser Vorgehensweise kann noch erheblich verbessert werden, wenn gemaB 
den Anspruchen 2 bzw. 4 anstelle der Interpretation des dem Mustervektor ahnlichsten Referenzmusters eine Lage- 
schatzung durch Reterenzmusterinterpolation durchgefuhrt wird. 

10 Die korrekte bzw. optimale Zuordnung zwischen Referenzmustern und Interpretation bzw. Lageparametem und 

Objektkennungen wird mit Hilfe eines Lernverfahrens gefunden, bei dem die Gesamtheiten der Referenzmuster und 
Interpretationen schrittweise unter dem EinfluB einer groBen Zahl von Trainingsmustervektoren, ausgehend von einer 
anfanglich zufalligen Wahl, verandert wird. Am Ende dieses Lernvorgangs reprasentieren die Referenzmuster die sta- 
tistische Verteilung der Trainingsmuster, und die strukturellen Eigenschaften der zu erkennenden Objekte sowie die 

15 strukturellen Eigenschaften des optischen Abbildungsprozesses sind in der Zuordnung zwischen Referenzmustern 
und Interpretationen kodiert. 

Weiterbildungen der Erfindung ergeben sich aus den Unteranspruchen. 

Figur 1 zeigt einen in die Abbildungsebene projizierten Quader mit Eckpunkten 1, 2, .... 7 sowie die zu den Eck- 
punkten 1 bzw. 3 gehorigen zweidimensionalen Koordinaten q(1), .... p(3). 
20 Figur 2 zeigt einen Ablaufplan des Verfahrens zur Lageschatzunc bzw. zur Objekterkennung bei gleichzeitiger 

Lageschatzung. 

Figur 3 zeigt einen Ablaufplan des Verfahrens zur Adaption von Referenzmustern zur Schatzung von Lagepara- 
metem bzw. zur Objekterkennung bei gleichzeiitiger Schatzung von Lageparametem. 

Anhand eines bevorzugten Ausfuhrungsbeispieles wird die Erfindung im folgenden weiter erlautert. 

25 Fur die typischen Anwendungen, z.B. in der Robotik, werden zweidimensionale Abbildungen von dreidimensio- 

nalen Objekten mit Hilfe elektronischer Kameras erzeugt. Dabei wird mit Hilfe einer optischen Abbildung der dreidi- 
mensionale Raum in eine zweidimensionale Bildebene projiziert. Die strukturellen Eigenschaften dieses optischen 
Abbildungsprozesses hangen von den optischen Eigenschaften der verwendeten Kamera ab und konnen im allgemei- 
nen durch das mathematische Modell der Zentralprojektion (auch perspektivische Projektion genannt) hinreichend 

30 genau beschrieben werden. Bei der Zentralprojektion wird jedem Raumpunkt X, Y, Z ein Punkt p, q in der Bildebene 
wie folgt zugeordnet: 

(1) (p,q) = (f.X/Z ( f.Y/Z) 

wobei f die Brennweite des optischen Abbi Id ungssy stems bezeichnet (YShirai ■Three-Dimensional Computer Vision", 

35 Springer-Verlag, Berlin, Heidelberg, New York, 1 987, 11-1 3). Das Ergebnis einer solchen optischen Abbildung mit Hilfe 
einer elektronischen Kamera ist am Ende eine zweidimensionale Abbildung des dreidimensionalen Objekts, welche 
in einem digitalen Bildspeicher vorliegt. 

Aus einer derartigen Abbildung, welche als zweidimensionale Matrix von Bildpunkten aufgefaBt werden kann, 
lassen sich mit Hilfe verschiedener Methoden der digitalen Bildvorverarbeitung markante Punkte in der Bildebene 

40 gewinnen, welche auch als Merkmalspunkte bezeichnet werden. Figur 1 zeigt einen in die zweidimensionale Bildebene 
deren Koordinatenachsen mit q bzw p bezeichnet sind, projizierten dreidimensionalen Quader mit sichtbaren Eckpunk- 
ten 1 , 2 7. Sind mit Hilfe geeigneter Methoden der digitalen Bildvorverarbeitung die Eckpunkte des Quaders in der 

Bildebene gefunden, so stehen deren zweidimensionale Koordinaten zur Lageschatzung bzw. Objekterkennung zur 
Verf ugung. Eine Ubersicht uber die zur Verf ugung stehenden Methoden zur Merkmalsextraktion findet sich in (Y. Shirai 

45 1987). Als Merkmalspunkte eignen sich in erster Linie die Abbilder von Objekteckpunkten. Diese lassen sich in der 
Bildebene auf vorteilhafte Weise als Schnittpunkte von Objektkanten auffinden. Damit ist das Problem der Lokalisierung 
von Eckpunkten in der Bildebene auf die Detektion von Kanten zuruckgefuhrt. Zur Detektion von Objektkanten in der 
Bildebene stehen eine Reihe von Verfahren zur Verf ugung, von denen die wichtigsten auf Kantenoperatoren oder auf 
der Hough-Transformation beruhen (J. Shirai 1987). 

so Urn auf diese Weise vorverarbeitete digitale Bilder als Objekte interpretieren zu konnen, muB die korrekte Zuord- 

nung zwischen den Punkten eines entsprechenden Objektmodells und den Merkmalspunkten in der Bildebene gefun- 
den werden. Dieses Problem wird durch die unbekannte Lage und unbekannte raumliche Orientierung der abgebildeten 
Objekte erheblich erschwert. Aus diesem Grund muB einer wissens- und modellbasierten Interpretation der vorverar- 
beiteten Bilder eine geeignete Lageschatzung vorangehen, deren Ziel die Bestimmung von Lageparametem des ab- 

55 gebildeten Objekts, d.h. von Rotationsparametem und eventuell einer Verschiebung ist. 

Die erfindungsgemaBe Losung dieses Problems bedient sich der Methode der adaptiven Vektorquantisierung, die 
auch als Kohonen-Netz bezeichnet wird. Da es sich hierbei urn eine adaptive Methode handelt, setzt die technische 
Anwendung dieser Methode ein geeignetes Lemverfahren voraus. Ein solches Lernverfahren wird deshalb im folgen- 
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den mit Bezug aul Figur 3 beschrieben. Zur Durchfuhrung dieses Lemverfahrens benotigt man ein raumliches Gitter 
von Neuronen, d.h. eine durch ganze Zahlen i indizierbare Gesamtheit RG von Referenzmustern m(i), wobei jedem 
Index i der Gesamtheit umkehrbar eindeutig ein Gitterpunkt (i(l), i{2), i(3)) mit ganzen Zahlen i(l), i(2) und i(3) zugeordnet 
ist. Jedes Neuron, d.h. jedes Element i der Gesamtheit ordnet bei einem vorgegebenen Mustervektor v seinem Refe- 
renzmuster m(i) mit Hilfe einer fur alle Neuronen gleichen Ausgabefunktion a(v,m) einen zu ihm gehorigen Ausgabewert 
a(v, m(i)) zu. Zu Beginn des Lemverfahrens werden die Werte aller Referenzmuster m(i) vollig zufallig gewahlt. 

Urn mit Hilfe eines solchen Kohonen-Netzes eine Lageschatzung durchfuhren zu konnen, wird jedem Neuror i 
eine Interpretation x(i) = (x(i,l), .... x(i, N)) zugeordnet. Zu Beginn des Lemverfahrens, d.h. der Adaption der Referenz- 
muster, werden die Werte der Komponenten aller Interpretationen x(i) ebenfalls vollig zufallig gewahlt. Die Komponen- 
ten der Interpretationen x(i) entsprechen dabei den zu schatzenden Lageparametern des abgebildeten Objektes. 

Zur Durchfuhrung der Adaption wird eine zeitabhangige Lernrate L(t) vorgegeben, die mit der Zeit monoton fallt. 
Diese Lernrate bestimmt die Geschwindigkeit des Lernvorgangs und wird um so kleiner, je we iter der Lernvorgang 
fortgeschritten ist. Bei experimentellen Untersuchungen des erfindungsgemaBen Verfahrens hat sich eine Lemraten- 
funktion der Form 

(2) L(t) = L(Start).exp (TII i^ln(kig!g) 

als vorteilhaft erwiesen. 

Dabei bezeichnen L(Start), L(Ende) bzw. t(Ende) eine vorgegebene anfangliche Lernrate, eine vorgegebene finale 
Lernrate bzw. einen Endzeitpunkt des Lemvorgangs. Ferner wird eine Kopplungsstarkefunktion h(i,j,t) vorgegeben, 
die je zwei Punkten (i(1 ),i(2),i(3)), (j(1 ).j(2), j(3)) auf dem Gitter eine Kopplungsstarke h zuordnet, welche monoton mit 
dem Abstand der Gitterpunkte und monoton mit der Zeit fallt. Experimented Untersuchungen haben gezeigt, daB eine 
besonders vorteilhafte Wahi der Kopplungsstarkefunktion durch 

2 

(3) h(i,i,t) = exp(- '"']" ) 
2.s z (t) 

mit 

(4) s(t) = 8(Sta rt ).exp (? ^.n(|i^)) 

gegeben ist. Dabei bezeichnet s(t) die momentane Reichweite der Kopplungsstarke funktion h, und die Symbole s 
(Start) bzw. s(Ende) bezeichnen vorgegebene anfangliche bzw. finale Reichenweiten der Kopplungsstarkefunktion. 

Diese Wahl der Kopplungsstarkefunktion gewahrleistet, daB die Kopplungsstarke zwischen zwei Neuronen mo- 
noton mit dem Abstand zwischen diesen Neuronen abnimmt, und daB die Kopplungsstarke bei gegebenem Abstand 
monoton mit der Zeit fallt. Hierdurch wird die Kopplung zwischen benachbarten Neuronen auf dem Gitter mit fortschrei- 
tender Zeit standig kurzreichweitiger und bei gegebenem Abstand standig schwacher. Vorzugsweise wird als Abstands- 
maB zwischen den Neuronen der euklidische Abstand gewahlt. 

Nachdem die Parameter des Lemverfahrens vorgegeben sind, beginnt nun das eigentliche Lernverfahren. Zu 
jedem Zeitschritt t wird ein Train ingsmustervektor v(t) = (v(l,t), ...v(M,t)), der aus zweidimensionalen Koordinaten von 
Merkmalspunkten in der Abbildung gebildet ist, und zu diesem Trainingsmustervektor gehorige Lageparameter XT(t) 

= (XT(l,t) XT(N,t)) vorgegeben. Bei jedem Zeitschritt t werden nun fur jeden Index i aus diesem vorgegebenen 

Trainingsmustervektor v(t) und den momentanen Werten der Referenzmuster m(i,t) = (m(i,l,t),...m(i,M,t)) die momen- 
tanen Ausgabewerte a(i,t) = a(v(t),m(i,t)) mit Hilfe der fur alle Neuronen identischen Ausgabefunktion a(v,m) berechnet. 
Dieser Ausgabewert ist ein MaB fur die Ahnlichkeit zwischen dem momentanen Wert des Referenzmusters m(i,t) des 
Neurons i und dem angelegten Trainingsmustervektor v(t). Um dasjenige Neuron in der Gesamtheit der Neuronen zu 
ermitteln, dessen Referenzmuster m dem angelegten Trainingsmustervektor am ahnlichsten ist, wird derjenige Index 
w(t) gesucht, dessen zugehoriger Ausgabewert a(w,t) optimal ist. 

Nach der Ermittlung des optimalen Ausgabewertes und des zu ihm gehorigen Index w(t) wird der eigentliche zu 
diesem Zeitpunkt t gehorige Adaptionsschritt durchgefOhrt: Die momentanen Werte der Referenzmuster m (i,t) aller 
Neuronen i und die dazugehorigen Lageparameter x(i,t) werden mit Hilfe der Beziehungen 

(5) m(i,t+l) = m(i,t) + L(t).h(i,w,t).(v(t)-m(i,t)) 

(6) x(i,t+l) = x(i.t) + L(t).h(i,w,t).(XT(t)-x(i,t)) 

adaptiert. 

Durch die Adaptionsbeziehungen (5) und (6) ist gewahrleistet, daB die Werteverteilung der Referenzmuster der 
statistischen Verteilung der Train ingsmustervektoren im Laufe des Lemvorgangs immer ahnlicher wird, und daB die 
den Trainingsmustervektoren und ihren zugehorigen Lageparametern entsprechenden Zusammenhange zwischen 
Mustervektoren und Lageparametern durch die sich wahrend der Adaption einstellende Beziehung zwischen den La- 
geparametern der Neuronen und den zugehorigen Referenzmustern widergespiegelt wird. Um die Konvergenz des 
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Lernverfahrens zu optimieren, ist die Wahl einer geeigneten Ausgabefunktion a(v,m) entscheidend. Verschiedene ex- 
perimentelle Untersuchungen haben gezeigt, daB hauptsachlich zwei verschiedene mogliche Wahlen der Ausgabe 
funktion a(v,m) zu einer optimalen Leistungsfahigkeit es Verfahrens fuhren. Die erste mogliche Wahl ist das Quadrat 
des euklidischen Abstands zwischen dem Mustervektor und dem Referenzmustervektor eines Neurons, 

5 

(7) a(v,m(i)) = | | v - | | 2 

M 

* T (v(k) - m(i,k)) 2 . 
10 k = 1 

Es ergibt sich nun aus den Beziehungen (5), (6) und (7), daB durch Minimierung der Ausgabewerte bei der Er- 
mittlung des optimalen Ausgabewertes a(m,t) die Konvergenz des Lernvorgangs im Sinne einer adaptiven Vektor- 
quantisierung gewahrleistet werden kann. 
is in sotchen Fallen, in denen die euklidische Norm der Mustervektoren konstant ist, ist es vorteilhaft, mit normierten 

Referenzmustern m(i) zu arbeiten. In diesem Fall kann anstelle des euklidischen Abstandes eine andere Ausgabe- 
funktion gewahlt werden, die durch 



*> (8) a(v,m(i)) = Z m(i,k) v(k) 

k = l 

gegeben ist. Bei Verwendung der Ausgabefunktion nach Gleichung (8) ist der optimale Ausgabewert der maximale 
Ausgabewert. 

2S Dies hangt damit zusammen, daB der Mustervektor mit den Komponenten v(k), k = I, ... M dem Referenzmuster 

m(i) mit den Komponenten m(i,k), k = I, ... m umso ahnlicher ist, je groBer das durch Gleichung (8) gegebene Skalar- 
produkt zwischen dem Mustervektor v und dem Referenzmuster m ist. 

Ist das Lemverfahren abgeschlossen, kann das train ierte neuronale Netz (Oder mit anderen Worten ausgedruckt, 
die adaptierte Gesamtheit von Referenzmustern) zur Lageschatzung dreidimensionaler Objekte herangezogen wer- 

30 den. Dazu werden aus einer gegebenen zweidimensionalen Abbildung des dreidimensionalen Objekts mit den bereits 
beschriebenen Verfahren zur Vorberarbeitung digitaler Bilder (Y. Sirai 1987) Merkmalspunkte extrahiert und die zwei- 
dimensionalen Koordinaten dieser Merkmalspunkte zu einem Mustervektor v zusammengefaBt. Dies Kann vorzugs- 
weise dadurch geschehen, daB die Komponenten v(k) des Mustervektors v in der Form 

3S (9) v(k) = (p(k).q(k))k=l,...,M 

gewahlt werden, wobei p(k) und q(k) die zweidimensionalen Koordinaten des Merkmalspunktes k in der Abbildungs- 
ebene (Figur 1) sind. Zur Schatzung der raumlichen Lage des durch diesen Mustervektor v reprasentierten dreidimen- 
sionalen Objekts wird nun gemaG Figur 2 fur jeden Index i der Gesamtheit von Neuronen der Ausgabewert a(i) = a(v, 
m(i)) berechnet. Daraufhin wird der Index w desjenigen Neurons gesucht, welches den optimalen Ausgabewert a(w) 

40 geliefert hat. Die Komponenten der Interpretation x(w) dieses Neurons mit dem Index w konnen nun als die optimale 
Schatzung der Lageparameter des durch den Mustervektor v reprasentierten Objekts angesehen werden. 

Die Qualitat dieser Schatzung laBt sich aber noch merklich verbessem, wenn anstelle der interpretation x(w) des 
optimalen Neurons mit dem Index w eine interpolierte Interpretation zur Lageschatzung verwendet wird. Eine solche 
interpolierte Interpretation laBt sich wie folgt berechnen: 

4S in der naheren Umgebung des optimalen Neurons mit dem Index w befinden sich infolge der speziellen Eigen- 

schaften der bereits beschriebenen Ref erenzmusteradaption andere Neuronen, deren Referenzmuster zu dem ange- 
legten Mustervektor v ebenfalls ahnlich sind, wenn auch die zu diesem Neuronen gehorenden Ausgabewerte lediglich 
suboptimal sind. Geleitet von der Vorstellung, daB die moglichen Mustervektoren v ein Kontinuum von Vektoren in 
einem M-dimensionalen Raum bilden, kann im allgemeinen vermutet werden, daB ein verbesserter Referenzmuster- 

so vektor durch Interpolation zwischen den Referenzmustervektoren der Neuronen in der unmittelbaren Umgebung des 
Neurons mit optimalem Ausgabewert gefunden werden kann. 

Zur Durchfuhrung dieser Interpolation werden folgende Schritte durchgefuhrt: 
Es wird eine Umgebung U des Neurons w mit optimalem Ausgabewert a(w) gewahlt, die vorzugsweise aus den nach- 
sten Nachbarn des Neurons w mit optimalen Ausgabewert besteht. AnschlieBend wird fur jedes Neuron u dieser Urn- 

55 gebung U die konvexe Linearkombination 

(10) m(w,u,b) = b . m (w) + (1-b) . m(u) 
gebildet. Hierbei ist b eine Zahl zwischen 0 und 1 . Fur diesen durch b parametrisierten interpolierten Referenzmuster- 



5 



EP 0 560 779 B1 



vektor m(w,u,b) wird eine ebenfalls durch b parametrisierte Ausgabefunktion a(v,m(w > u,b)) berechnet. Als Ausgabe- 
f unktion wird vorzugsweise wieder eine der beiden in den Gleichungen (7) bzw. (8) angegebenen Formen verwendet. 
Aufgrund der einfachen anatytischen Form der beschriebenen Ausgabefunktionen, laBt sich ein optimaler Wert der 
durch b parametrisierten Ausgabefunktion in Abhangigkeit von b geschlossen aufsuchen. Dieser optimale Wert von b 

5 wird fur jedes Neuron u der Umgebung mit b(u) bezeichnet. Auf diese Weise ergibt sich fur samtliche Neuronen der 
Umgebung ein Zahlenwert b(u) zwischen 0 und 1 und ein dazu gehoriges interpoliertes Refernzmuster m(w,u,b(u)). 
Unter diesen interpolierten Referenzmustem wird nun das optimale interpolierte Referenzmuster dadurch gefunden, 
daB fur samtliche interpolierten Referenzmuster mfw.u.b.fu)) aller Neuronen u der Umgebung die zugehorigen Aus- 
gabewertea(v,m(w, u,b(u))) berechnet werden. Der optimale und damit verbesserte interpolierte Referenzmustervektor 

io m(w,opt) ergibt sich nun als derjenige Referenzmustervektor mit optimalem zugehorigen Ausgabewert a(v, m (w,u,b 
(u)). Bezeichnen wir den zu diesem Referenzmuster gehorigen Interpolationskoeffizienten mit b(opt), so ergibt sich 
eine verbesserte Lageschatzung x nach der Formel 

(11) x = b(opt) . x(w) + (1 -b(opt)) . x(opt) 

is wobei x(opt) die zu dem Neuron mit optimalen interpolierten Referenzmuster gehorige Interpretation ist. 

Experimentelle Untersuchungen haben gezeigt, daB bei Benutzung des hier beschriebenen Interpolationsverfah- 
rens die Genauigkeit der Lageschatzung urn ca. 85% verbessert werden konnte. 

Eine noch weitergehende Verbesserung der Lageschatzung laBt sich durch eine andere Art der Interpolation er- 
reichen: Dazu bildet man aus alien Referenzmustem m(u) mit u aus einer vorgegebenen Umgebung U von b die 
20 konvexe Linearkombination 



(12) m = 2f b(u)-m(u) 
u€ U 

25 

(13) = b(w).m(w) ♦ Z b(u)-m(u) 

u 4 w 

mit 

(14) ^ b(u) = b<*) * 2 b(u) n 1 

35 U € U U* W 

und 

(15) O^b(u), b(w) ^ 1. 

40 AnschlieBend sucht man das Optimum der Funktion a(v,m) als Funktion der Koeffizienten b(u) und b(w). Mit den 

optimalen Koeffizienten b(u,opt) und b(w.opt) berechnet man dann die interpolierte Lageschatzung zu 

(16) x = 2 b(u f opt) • x(u) 



(17) = b(w,opt) • x(w) ♦ 2" b(u, opt) • x(u) 

Die weitgehende Unempfindlichkeit des Verfahrens zur Lageschatzung gegenuber Fehlern bei der Bestimmung 
der Koordinaten von Merkmalspunkten laBt sich noch verbessern, wenn man anstelle der Ausgabefunktion (7) die 
Ausgabe funktion 

M 

(18) a(v,m(l)) = Q(v f k).(v(k) - m(i,k)) 2 

k = l 

verwendet, bei der die Gewichte g(v,k) ein MaB fur die Zuverlassigkeit bzw Genauigkeit der Werte der Komponenten 
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v(k) des Mustervektors v sind. ZweckmaBig setzt man dazu g(v,k) = 1 , falls v(k) ohne Unsicherheit vorliegt und g(v,k) 
= 0, falls der Wert von v(k) unbekannt ist. Fur alle Falle zwischen diesen Extremen liegt g(v,k) zwischen 0 und 1. 

Das hier beschriebene Verfahren la&t sich auch dann noch mit Erfolg anwenden, wenn nicht nur die raumliche 
Lage und Orientierung eines bekannten Objekts geschatzt werden soil, sondem wenn daruber hinaus die Identttat 

5 eines a priori unbekannten Objektes, welches einer bekannten Menge von Objekten entnommen ist, gleichzeitig mit 
der Lage und Orientierung dieses Objekts im Raum ermittelt werden soli. Urn das beschriebene Verfahren um diesen 
Leistungsumfang zu erweitern, ist zu den den zu schatzenden Lageparametern entsprechenden Komponenten der 
Interpretationen eine weitere Komponente, welche der Objektkennung entspricht, hinzuzuf Ogen. Bei der Durchf uhrung 
des Lernverfahrens ist dann zu jedem Train ingsmustervektor neben den zu diesem Trainingsmustervektor gehdrigen 

10 Lageparametern die zutreffende Objektkennung anzugeben. Nach Ablauf des so durch get uhrten Lernverfahrens ist 
das neuronale Netz somit in der Lage, neben den unbekannten Lageparametern auch die Objektidentrtat zu bestimmen. 

Dabei ist aber zu beachten, daft bei Verwendung der Interpolationsverfahren nur die den Lageparametern ent- 
sprechenden Komponenten der Interpretationen interpoliert werden, da eine Linearkombination von Objektkennzahlen 
sinnlos ist. 

is 

Patentanspruche 

1. Verfahren zur Schatzung von Lageparametern eines Objekts im Raum aus einer zweidimensionalen Abbildung 
20 unter Verwendung eines Kohonen-Netzes mit einem raumlichen Gitter von Neuronen, 

a) bei dem durch ganze Zahlen i, die jedes Neuron i des Kohonen-Netzes eindeutig identifizieren, indizierbare 
Gewichtsvektoren m(i) = (m(i, 1), .... m(i, M) der Dimension M und den Gewichtsvektoren m(i) zugeordnete 
Lageparameter x(i) = (x(i, 1) x(i, N) der Dimension N vorgegeben sind, wobei jedem Index i ein Punkt (i 

2S (1), j(2), i(3)) auf einem Gitter im dreidimensionalen Raum umkehrbar eindeutig zugeordnet ist, 

b) bei dem aus zweidimensionalen Koordinaten p(k), q(k) von Merkmalspunkten in der Abbildung ein Muster- 
vektor v = (v(1), v(k), .... v(M)) gebildet wird, wobei v(k) jeweils in der Form v(k) = (p(k), q(k)) einen Merk- 
malspunkt in der Abbildung beschreibt, 

c) bei dem der Mustervektor v = (v(1 ) .... v(k), .... v(M)) an jedes Neuron i des Kohonen-Netzes angelegt wird, 
30 d) bei dem in jedem Neuron i des Kohonen-Netzes jeweils ein Ausgabewert a(i) = a(v, m(i)) fur den angelegten 

Mustervektor v = (v(1), .... v(k) v(M)) ermittelt wird, und 

e) bei dem die gesuchten Lageparameter sich ergeben aus jeweils dem dem Neuron i zugeordneten Lage- 
parameter x(i) = (x(i, 1), .... x(i, N), das den optimalen Ausgabewert a(v, m(i)) aufweist. 

35 2. Verfahren zur Schatzung von Lageparametern eines Objekts im Raum aus einer zweidimensionalen Abbildung 
unter Verwendung eines Kohonen-Netzes mit einem raumlichen Gitter von Neuronen, 

bei dem die Verfahrensschritte a) bis d) des Anspruchs 1 durchgefuhrt werden, 

bei dem fur alle Gitterpunkte u aus einer vorgegebenen Umgebung U eines Gitterpunktes w, der durch das 
40 Neuron i identifiziert wird, das den optimalen Ausgabewert a(v, m(i)) aufweist, ein Optimum einer Funktion 

A (u, b) = a(v, b • m(w) + (1 - b) • m(u)) 
einer reellen Veranderiichen b mit 0 £ b £ 1 ermittelt wird, 

bei dem unter alien Gitterpunkten u der Umgebung des Gitterpunktes w derjenige Gitterpunkt opt ermittelt 
45 wird, fur den gilt: 

A(opt, b(opt)) ist optimal unter alien A(u, b(u)), 

wobei b(u) die Lage des Optimums von A(u, b) als Funktion von b auf dem Intervall 0 % b £ 1 bezeichnet, und 
bei dem die gesuchten Lageparameter x(i) sich ergeben aus der Beziehung 

so *(<) = b(opl) • x(w) + (1 -b(opt)) • x(opt) 

als konvexe Linearkombination aus den Lageparametern zweier Gitterpunkte. 

3. Verfahren zur Schatzung von Lageparametern eines Objekts im Raum aus einer zweidimensionalen Abbildung 
unter Verwendung eines Kohonen-Netzes mit einem raumlichen Gitter von Neuronen, 

55 

bei dem die Verfahrensschritte a) bis d) des Anspruchs 1 durchgef uhrt werden, 

bei dem fur alle Gitterpunkte u aus einer vorgegebenen Umgebung U eines Gitterpunktes w, der durch das 
Neuron i identifiziert wird, das den optimalen Ausgabewert a(v, m(i)) aufweist, ein Optimum einer Funktion 
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A(b{u),b(w)) = a(v t bWmM+ lb(u)^m(u)) 



einer reellen Veranderlichen b mil 0 £ b < 1 ermittelt wird. und 

bei dem die gesuchten Lageparameter x(i) sich ergeben aus der Beziehung 



x{i) = b(w t opt) • x{w) + Xb(u,opf ) • x(u) 



a!s konvexe Linearkombination von Lageparametem x(w) und x(u). 

Verfahren zur Erkennung eines Objekts und zur Schatzung von Lageparametem eines Objekts im Raum aus einer 
zweidimensionalen Abbildung unter Verwendung eines Kohonen-Netzes nach einem der Anspruche 1 bis 3, 
bei dem zusatzlich zu den Lageparametem Identifikatoren der zu erkennenden Objekte, die den Neuronen i zu- 
geordnet werden, zur Objekterkennung berucksichtigt werden. 

Verfahren zur Adaption von Gewichtsvektoren m(i) = (m(i, 1), .... m(i, M) zur Schatzung von Lageparametem eines 
Objekts im Raum aus einer zweidimensionalen Abbildung unter Verwendung eines Kohonen-Netzes mit einem 
raumlichen Gitter von Neuronen, 

a) bei dem durch ganze Zahlen i, die jedes Neuron i des Kohonen-Netzes eindeutig identifizieren, indizierbare 
Gewichtsvektoren m(i) = (m(i, 1), .... m(i, M) der Dimension M und den Gewichtsvektoren m(i) zugeordnete 
Lageparameter x(ij = (x(i, 1), .... x(i, N) der Dimension N vorgegeben sind wobei jedem Index i ein Punkt 
i(2), i(3)) auf einem Gitter im dreidimensionalen Raum umkehrbar eindeutig zugeordnet ist, und 

b) bei dem fur jeden Zeitpunkt t der Adaption 

eine Lernrate L(t) vorgegeben ist, die mit der Zeit monoton fallt, 

- eine Kopplungsstarkefunktion h(i, j, t) vorgegeben ist, die je zwei Punkten (i(1 , i(2), i(3)); j(2), j(3)) 
auf einem Gitter, das durch die Neuronen i des Kohonen-Netzes gebildet wird, eine Kopplungsstarke h 
zuordnet, welche monoton mit dem Abstand der Gitterpunkte und monoton mit der Zeit fallt, 

• ein Trainingsmustervektor v(t) = (v(1 , t), .... v(M, t)) der Dimension M, der aus zweidimensionalen Koor- 
dinaten von Merkmalspunkten in der Abbildung gebildet ist, und zu diesem Trainingsmustervektor geho- 
rige Lageparameter XT(t) = (XT(1, t), .... XT(N, t)) vorgegeben ist, 

- fur jedes Neuron i aus dem vorgegebenen Trainingsmustervektor v(t) und den momentanen Gewichts- 
vektoren m(i, t) zum Zeitpunkt t die momentanen Ausgabewerte a(i, t) = a(v(t), m(i, t)) zum Zeitpunkt t 
ermittelt werden, 

bei dem das Neuron w mit optimalem Ausgabewert a(v, m(i)) ermittelt wird, 
bei dem die Gewichtsvektoren m(i, t) jedes Neurons i mit Hilfe der Beziehungen 



adaptiert werden. 
Verfahren nach Anspruch 5, 

bei dem zusatzlich Identikatoren zur Objekterkennung bei der Adaption berOcksichtigt werden 

Verfahren nach einem der Anspruche 5 Oder 6, 
bei dem die Lernrate L(t) folgende Form aufweist: 



wobei L(Start) eine anfangliche Lernrate bezeichnet und L(Ende) eine finale Lernrate bezeichnet bis zu einem 
Endzeitpunkt t(Ende) der Adaption. 



m(i, t+1 ) = m(i, t) + L(t) • h(i, w, t) • (v(t) - m(i, t)) 



x(i, t+1 ) = x(i, t) + L(t) • h(i, w, t) • (XT(t) - x(i, t)) 
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8. Verfahren nach einem der Anspruche 5 bis 7, 

bei dem die Kopplungsstarkefunktion h(i, j, t) die folgende Form aufweist: 



h{ij,t) = exp 



2«S 2 <0, 



mit 



5(f) = s{Start ).expf — '— Inf ^f^ll 

wobei s(Start) eine vorgegebene anfangliche Reichweite bezeichnet und s(Ende) eine vorgegebene finale Reich- 
weite bezeichnet bis zu einem Endzeitpunkt t(Ende) der Adaption. 

9. Verfahren nach einem der vorhergehenden Anspruche, 

bei dem die Ausgabewerte a(i) durch folgende Beziehung ermittelt werden: 

a(^m(/)) = |v-/n(i)| 2 = I,(v(k)-m(i t k)) 2 , 

und 

bei dem die optimalen Ausgabewerte durch die minimalen Ausgabewerte a(i) gebildet werden. 

10. Verfahren nach einem der vorhergehenden Anspruchen, 

bei dem die Ausgabewerte a(i) durch folgende Beziehung ermittelt werden: 

a(v,m(/))= lg{v.k).{v(k)-m{i,k)) 2 , 
/c=1 

wobei Gewichte g(v, k) ein MaB fOr die Zuverlassigkeit der Werte der Komponenten v(k) des Mustervektors v 
darstellen, und 

bei dem die optimalen Ausgabewerte durch die minimalen Ausgabewerte a(i) gebildet werden. 

11. Verfahren nach einem der vorhergehenden Anspruche, 

bei dem die Ausgabewerte a(i) durch folgende Beziehung ermittelt werden: 

x M 

a{v.m{i))= lmU.k)*v{k), 

und 

bei dem die optimalen Ausgabewerte durch die maximalen Ausgabewerte a(i) gebildet werden. 

12. Verfahren nach einem der vorhergehenden Anspruche, 

bei dem die Lageparameter x(i) mindestens Rotationswinkel bezogen auf drei Achsen eines raumlicher Koordi- 
natensystems aufweisen. 

Claims 

1. Method for estimating position parameters of an object in space from a two-dimensional image by using a Kohonen 
network having a spatial grid of neurons, 
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a) in which weighting vectors m(i) = (m(i, 1), m(i, M)) of dimension M, which can be indexed by whole 
numbers i which uniquely identify each neuron i of the Kohonen network, are provided, and position parameters 
x(i) = (x(i, 1), x(i, N)) of dimension N assigned to the weighting vectors m(i) are provided, it being the case that 
each index i is assigned a point (i(1), i(2), i(3)) on a grid in three-dimensional space in a reversible unique 
fashion, 

b) in which a master vector v = (v(1), .... v(k), v(M)) is formed from two-dimensional coordinates p(k), q(k) 
of feature points in the image, v(k) respectively describing a feature point in the image in the form of v(k) = (p 
(K). q(k)), 

c) in which the master vector v = (v(1), v(k), .... v(M)) is applied to each neuron i of the Kohonen network, 

d) in which an output value a(i) = a(v, m(i)) is determined for the applied master vector v = (v(1), v(k) v 

(M)) in each case in each neuron i of the Kohonen network, and 

e) in which the position parameters being sought are yielded from the position parameter x(i) = (x(i, 1) x 

(i, N), which is respectively assigned to the neuron i and has the optimum output value a(v, m(i)). 

Method for estimating position parameters of an object in space from a two-dimensional image by using a Kohonen 
network having a spatial grid of neurons, 

in which the method steps a) to d) of Claim 1 are carried out, 
in which an optimum of a function 

A (u, b) = a(v, b • m(w) + (1 - b) • m(u)) 

of a real variable b, where 0 < b < 1 , is determined for all grid points u from a prescribed environment U of a 
grid point w which is identified by the neuron i which has the optimum output value a(v, m(i)), 
in which from among all the grid points u of the environment of the grid point w that grid point opt is determined 
for which it holds that: 

A(opt, b(opt)) is optimal among all A(u, b(u)), 

b(u) denoting the position of the optimum of A(u, b) as a function of b in the interval 0 £ b <> 1 , and 
in which the position parameters x(i) being sought are yielded from the relationship 

x(i) = b(opt) • x(w) + (1 -b(opt)) • x(opt) 

as a convex linear combination from the position parameters of two grid points. 

Method for estimating position parameters of an object in space from a two-dimensional image using a Kohonen 
network having a spatial grid of neurons, 

in which the method steps a) to d) of Claim 1 are carried out, 
in which an optimum of a function 

A(b(u),b(w)) s a(v,b(w)«m(w)+ Eb(u)*m(u)) 

of a real variable b, where 0 < b <, 1 , is determined for all grid points u from a prescribed environment U of a 
grid point w which is identified by the neuron i which has the optimum output value a(v, m(i)), 
in which the position parameters x(i) being sought are yielded from the relationship 

x(i) ab(w # opt) «x(w) ♦ Eb(u,opt) •x(u) 

u*w 

as the convex linear combination of position parameters x(w) and x(u). 

Method for detecting an object and estimating position parameters of an object in space from a two-dimensional 
image by using a Kohonen network according to one of Claims 1 to 3, in which, for the purpose of object detection, 
in addition to the position parameters consideration is given to identifiers of the objects to be detected, which are 
assigned to the neurons i. 

Method for adapting weighting vectors m(i) = (m(i, 1 ) m(i, M) for the purpose of estimating position parameters 

of an object in space from a two-dimensional image by using a kohonen network having a spatial grid of neurons, 
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a) in which weighting vectors m(i) = (m(i, 1), m(i, M)) of dimension M which can be indexed by whole 
numbers i which uniquely identify each neuron i of the Kohonen network, are provided, and position parameters 
x(i) = (x(i, 1), ... x(i, N)) of dimension N assigned to the weighting vectors m(i) are provided, it being the case 
that each index is assigned a point (i(1), i(2), i(3)) on a grid in three-dimensional space in a reversible unique 
fashion, and 

b) in which for each instant t of the adaptation 

a learning rate L(t) is prescribed which decreases monotonically with time, 

a coupling strength function h(i, j, t) is prescribed which assigns the two points (i(1, i(2), i(3)), (j(1), j(2), j 
(3)) on a grid which is formed by the neurons i on the Kohonen network in each case a coupling strength 
h which decreases monotonically with the spacing of the grid points and monotonically with time, 

a training master vector v(t) = (v(1 , t) v(M, t)) of dimension M, which is formed from two-dimensional 

coordinates of feature points in the image, and position parameters XT(t) = (XT(1 , t) XT(N, t)) belonging 

to this training master vector is prescribed, 

for each neuron i the instantaneous output values a(i, t) = a(v(t), m(i, t)) are determined at the instant t 
from the prescribed training master vector v(t) and the instantaneous weighting vectors m(i, t) at the instant 
t, 

in which the neuron w is determined by means of the optimum output value a(v, m(i)), and 

in which the weighting vectors m(i, t) of each neuron i are adapted with the aid of the relationships 



Method according to Claim 5, in which, for the purpose of object detection, identifiers are additionally given con- 
sideration during adaptation. 

Method according to one of Claims 5 and 6, in which the learning rate L(t) has the following form: 



L(start) denoting an initial learning rate and L(end) denoting a final learning rate up to a final instant t(end) of the 
adaptation. 

Method according to one of Claims 5 to 7, in which the coupling strength function h(i, j, t) has the following form: 



s(start) denoting a prescribed initial range and s(end) denoting a prescribed final range up to a final instant t(end) 
of the adaptation. 

Method according to one of the preceding claims, 

in which the output values a(i) are determined by the following relationship: 



m(i, t+1) = m(i, t) + L(t) • h(i, w, t) • (v(t) - m(i, t)) 



x(i, t+1) = x(i, t) + L(t) • h(i, w, t) • (XT(t) - x(i, t)). 



L(t) = L(Start)»exp\ 





where 
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b(vM0) = jv - m{i)\ 2 = l(v(*) - m(i.k)) 2 . 

and, 

in which the optimum output values are formed by the minimum output values a(i). 

10. Method according to one of the preceding claims, 

in which the output values a(i) are determined by the following relationship: 

a(v.m{0) = Xg(v.k).{v{k)-m(i,k)) 2 , 
*=1 

the weights g(v, k) representing a measure of the reliability of the values of the components v(k) of the master 
vector v, and 

in which the optimum output values are formed by the minimum output values a(i). 

1 1 . Method according to one of the preceding claims, 

in which the output values a(i) are determined by the following relationship: 

, M 

a(v t m(0)= Zm(i.k).v(k). 
*=1 

and, 

in which the optimum output values are formed by the maximum output values a(i). 

12. Method according to one of the preceding claims, in which the position parameters x(i) have at least rotational 
angles referred to three axes of a spatial coordinate system. 

Revendlcatlons 

1. Procede devaluation des parametres de position d'un objet dans I'espace a partir d'une image bidimensionnelle 
au moyen d'un reseau de Kohonen avec une grille spatiale de neurones 

a) dans lequel au moyen de nombres entiers i, qui identifient de maniere univoque chaque neurone i du r6seau 
de Kohonen avec une grille spatiale de neurones, on predetermine des vecteurs de ponderation indiciables 

m(i) = (m(i, 1 ), .. . , m(i, )) de la dimension M et des parametres de position x(i) = (x(i, 1 ) x(i, N) de la dimension 

N correspondant au vecteur de ponderation m(i), un point (i(1), i(2), i(3)) sur une grille de I'espace tridimen- 
sionnel correspondant de facon reciproque et univoque a chaque indice i, 

b) dans lequel on cree a partir des coordonnees bidimensionnelles p(k) et q(k) de points caracteristiques dans 
I'image un vecteur type v = (v(1), .... v(k), v(M)), ou v(k) decrit a chaque fois un point caracteristique dans 
I'image sous la forme v(k) = (p(k), q(k)), 

c) dans lequel le vecteur type v = v(1 ), .... v(k), v(M) est associe a chaque neurone i du reseau de Kohonen, 

d) dans lequel on determine dans chaque neurone i du r6seau de Kohonen une valeur de sortie respective a 
(i) = a (v, m(i)) pour le vecteur type associe v = v(1 ), .... v(k), .... v(M), et 

e) dans lequel on determine les parametres de position recherches a partir du parametre de position x(i) = (x 
(i, t), .... x(i, N) correspondant au neurone respectif, qui comporte la valeur de sortie optimale a(v, m(i)). 

2. Procede devaluation des parametres de position d'un objet dans I'espace a partir d'une image bidimensionnelle 
au moyen d'un reseau de Kohonen avec une grille spatiale de neurones 

dans lequel on execute les etapes a) a d) du procede selon la revendication 1, 

dans lequel on determine pour tous les points de grille u, a partir d'un milieu environnant U predetermine d'un 
point de grille w identifie par le neurone i comportant la valeur de sortie optimale a(v, m(i), un optimum d'une 
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fonction 

A (u, b) = a(v, b . m(w) + (1 - b) . m(u)) 
d'une variable r£elle b avec 0 < b < 1 . 

dans lequel, parmi tous les points de grille u du milieu environnant du point de grille w, on determine le point 

de grille opt., pour lequel on a : 

A(opt, b(opt)) est optimal parmi tous les A(u, b(u)), 

b(u) decrivant la position de I'optimum de A(u, b) comme fonction de b dans I'intervalle 0 < b £ 1, et 
dans lequel on obtient les parametres de position recherches x(i) par la relation 

x(i) = b(opt) . x(w) + (1-b(opt)) . x(opt) 
comme combinaison lineaire convexe des parametres de position des points de grille. 

Procede devaluation des parametres de position d'un objet dans I'espace a partir d'une image bidimensionnelle 
au moyen d'un r6seau de Kohonen avec une grille spatiale de neurones 

dans lequel on execute les etapes a) a d) du procede selon la revendication 1 , 

dans lequel on determine pour tous les points de grille u, a partir d'un milieu environnant U predetermine* d'un 
point de grille w identified par le neurone i comportant la valeur de sortie optimale a(v, m(i)), un optimum d'une 
fonction 

A(b(u),b(w)) = a(v, b(w) . m(w) + Ib(u). m(u)) 

d'une variable reelle b avec 0 < b <, 1 , et 

dans lequel on obtient les parametres de position recherches x(i) par la relation 

x(i) = b(w.opt) . x(w) + Ib(u,opt) . x(u) 

comme combinaison Iin6aire convexe des parametres de position x(w) et x(u). 

Procede de reconnaissance d'un objet et devaluation des parametres de position d'un objet dans I'espace a partir 
d'une image bidimensionnelle au moyen d'un r6seau de Kohonen selon Tune des revendications 1 a 3, 
dans lequel, outre les parametres de position, on prend en consideration pour la reconnaissance de I'objet des 
identificateurs de I'objet a reconnaitre, correspondant aux neurones i. 

Proc6d6 d'adaptation de vecteurs de ponderation m(i) = (m(i, 1) m(i, M)) pour revaluation des parametres de 

position d'un objet dans I'espace a partir d'une image bidimensionnelle au moyen d'un reseau de Kohonen avec 
une grille spatiale de neurones 

a) dans lequel au moyen de nombres entiers i, qui identifient de maniere univoque chaque neurone i du r6seau 
de Kohonen avec une grille spatiale de neurones, on predetermine des vecteurs de ponderation indiciables 
m(i) = (m(i, 1), .... m(i, M)) de la dimension M et des parametres de ponderation x(i) = (x(i, 1 , .... x(i, N)) de la 
dimension N correspondant au vecteur de ponderation m(i), un point (i(1 ), i(2, i(3)) de I'espace tridimensionnel 
correspondant de facon univoque et reciproque a chaque indice i, et 

b) dans lequel a chaque moment t de Tadaptation 

on predetermine un rythme d'apprentissage L(t) d6croissant rdgulierement avec le temps, 
on predetermine une fonction de force de couplage h(i, j, t) qui fait correspondre a chacun des deux points 
(i(1), i(2), i(3); j(2), j(3)) d'une grille constitu6e par les neurones i du reseau de Kohonen une force 
de couplage h qui decrolt regulierement avec ia distance entre les points de grille et r6gulierement avec 
le temps, 

on predetermine un vecteur type d'apprentissage v(t) = (v(1 , t) v(M, t) de la dimension M, cr§e* a partir 

de coordonnees bidimensionnelles de points caracteristiques de ('image, et des parametres de position 



13 



EP 0 560 779 B1 

XT(t) = XT(1 , t), .... XT(M, t)) appartenant a ce vecteur type d'apprentissage. 

on determine a i'instant t pour chaque neurone i, a partir du vecteur type d'apprentissage v(t) predetermine 
et des vecteurs instantanes de ponderation m(i, t) a I'instant t, la valeur de sortie instantanee a(i, t) = a 
(v, t). m(i,t)). 

dans lequel on determine le neurone w possedant la valeur de sortie optimale a(v, m(i)), 

dans lequel on adapte les vecteurs de ponderation m(i, t) de chaque neurone i au moyen des relations 

m(i, t+1) = m(i, t) + L(t) • h(i, w, t) • (v(t) - m(i,t)) . 
x(i, t+1 ) = x(i, t) + L(t) • h(i, w, t) • (XT(t) - x(i, t)). 

6. Procede selon la revendication 5, 

dans lequel on prend de plus en consideration des identificateurs de reconnaissance de I'objet lors de I'adap- 
tation. 

7. Procede selon Tune des revendications 5 ou 6, 

dans lequel le rythme d'apprentissage L(t) est de la forme suivante 

L(t) * L(commencement).exp|— i-r In f— -]] 

w x 7 (t(fm) ^(commencement);; 

ou L(commencement) represente un rythme d'apprentissage initial et L (fin) un rythme d'apprentissage final 
au moment final t(fin) de I'adaptation. 

8. Procede selon Tune des revendications 5 a 7, 

dans lequel la fonction de force de couplage h (i, j, t) est de la forme suivante 

avec 

s (t) = s (commencement) . exp [ — ^— In [ — s ^ 1 ) 

^t (fin) vs (commencement) J ) 

ou s(commencement) represente une valeur initiale predeterminee et s(fin) une valeur finale predeterminee 
au moment final t(fin) de I'adaptation. 

9. Procede selon I'une des revendications precedentes, 

dans lequel on obtient les valeurs de sortie a(i) au moyen de la relation suivante 

M 

a(v,m(i)) = llv-m(i)||» = I(v(k) - m(i,k))2, et 

k = 1 

dans lequel les valeurs de sortie optimales sont constitutes par les valeurs de sortie minimales a(i). 

10. Proced6 selon I'une des revendications prec6dentes, 
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dans lequel on obtient la valeur de sortie a(i) au moyen de la relation suivante 

M 

a(v(m(i)) = I g(v,k) . (v(k) - m (i,k)) 2 
k = 1 

ou les ponderations g(v, k) represented une mesure de la fidelite des composantes v(k) du vecteur type v, 
et 

dans lequel les valeurs de sortie optimales sont constitutes par les valeurs de sortie minimales a(i). 

11. Proc6d6 selon I'une des revendications prectdentes, 

dans lequel on obtient les valeurs de sortie a(i) au moyen de la relation suivante 

M 

a (v,m(i)) = £ m (i,k) • (v (k), et 
k = l 

dans lequel les valeurs de sortie optimales sont constitutes par les valeurs de sortie maximales a(i). 

12. Precede selon I'une des revendications precedentes, 

dans lequel les parametres de position x(i) component au moins des angles de rotation rapportes aux trois 
axes d'un systeme de coordonnees spatiales. 
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FIG 3 
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